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【摘要 】 背景 开展 好 中 医药 科技 成 果 评 价 工作 对 推动 中 医药 创新 发 展 意义 重大 。 既 往 的 中 医药 科技 成 果 评价 


党 套用 笼统 的 评价 方法 ， 造 成 指标 不 适用 、 维 度 单一 等 问题 ,不 利于 科学 、 全 面 地 反映 成 果 的 多 元 价值 。 因 此 ， 新 时 
其 中 医药 科技 成 果 评 价 明 需 建立 分 类 、 多 维度 的 评价 指标 体系 。 目 的 ”遵循 我 国 新 时 期 科技 评价 要 求 ， 针 对 中 医药 临 
床 研究 类 科技 上 成果， 建立 体现 中 医药 规律 、 突 出 中 医药 优势 的 科学 、 分 类 、 可 靠 、 全 面 的 评价 指标 体系 。 方法 ”本 研 


究 开 始 于 2022 年 11 月 ， 完 成 于 2023 年 5 月 。 基 于 对 相关 文献 资料 的 梳理 分 析 ， 结 合 专题 小 组 讨论 ， 初 步 形成 指标 


框架 ;通过 两 轮 德尔 菲 专家 咨询 ， 确 定 评价 指标 和 评价 要 点 ; 采用 层次 分 析 法 ， 计 算 指标 权重 。 结 果 最终 确定 的 中 


医药 临床 研究 类 科技 成 果 评价 指标 体系 包含 门槛 指标 10 条 , 一 级 指标 4 条 , 二 级 指标 17 条 , 评价 要 点 17 条 。 经 检验 ， 


两 轮 德尔 非法 实施 中 专家 积极 系数 均 为 100%， 权 威 系数 分 别 为 0.94 和 0.93， 各 级 指标 Kendall's W 一 致 性 检验 双 侧 检 
验 显著 性 P 均 <0.05， 表 明 专 家 积极 程度 、 权 威 程度 高 ， 专 家 意见 一 致 性 强 ， 咨 询 结果 可 靠 。 结 论 ” 本 研究 围绕 中 医 
药 临 床 研究 类 科技 成 果 评 价 ， 构 建 了 一 套 科学 、 人 合理、 可靠、 易 操作 的 指标 体系 。 指 标 涵盖 范围 广 ， 权 重 区 分 度 高 ， 
具有 一 定 中 医 特 色 ， 有 利于 在 全 面 考虑 成 果 多 元 价值 的 同时 凸显 核心 优势 。 同 时 ， 配 套 建 设 的 评价 要 点 一 定 程 度 上 增 
强 了 指标 体系 的 可 操作 性 ， 可 能 为 相关 评价 活动 提供 潜在 参考 。 
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[ Abstract] Background The effective evaluation of scientific and technological achievements in traditional Chinese 
medicine (TCM ) is of great significance in promoting the innovative development of TCM. Previous evaluations of scientific 
and technological achievements in TCM often used a generalized evaluation method, leading to problems such as inappropriate 
indicators and limited dimensions, which is not conducive to reflecting the multiple values of achievements in a scientific and 
comprehensive way. Consequently, there is an urgent need to establish categorized and multi—dimensional evaluation index system 
for the evaluation of scientific and technological achievements in TCM in the new period. Objective To establish a scientific, 
categorized, reliable and comprehensive evaluation index system that reflects the principles of TCM and highlights its unique 
advantages aiming at the scientific and technological achievements in TCM, in accordance with the contemporary requirements for 
scientific and technological evaluation in China. Methods This study began in November 2022 and was completed in May 2023. 
A preliminary index framework was developed through literature review and focus group discussions. Delphi expert consultation 
was then conducted over two rounds to determine the evaluation indexes and points. The hierarchical analysis method was used 
to calculate the weight of each index. Results The final evaluation index system of scientific and technological achievements in 
TCM clinical research comprised 10 threshold indicators, 4 primary indicators, 17 secondary indicators, and 17 evaluation 
points. After testing, the positive coefficient of experts in both rounds of Delphi method implementation was 100%, the authority 
coefficient was 0.94 and 0.93, respectively. The Kendall's W consistency test for each level of indicators yielded two-tailed 
significance ( P<0.05 ) , indicated high levels of expert positivity and authority, strong consistency of expert opinion, and 
reliable consulting results. Conclusion This study constructs a scientific, reasonable, reliable and easy—to—operate evaluation 
index system for scientific and technological achievements in TCM clinical research. The indexes cover a wide range with highly 


differentiated weights and TCM characteristics, which is conducive to highlighting the core strengths while comprehensively 
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considering the multiple value of the results. Additionally, the associated evaluation points, enhancing the operationalization of 


the index system, may potentially serve as a valuable reference for related evaluation activities. 
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technological achievements; Categorical evaluation 


中 医药 作为 我 国 特有 的 卫生 资源 ， 其 发 展 已 上 升 至 
国家 战略 高 度 。 大 力 发 展 中 医药 科学 技术 研究 ， 抢 占 科 
研 高 地 ， 推 动 传统 医学 与 现代 科技 紧密 结合 ， 是 实现 中 
医药 振兴 发 展 的 有 力 支撑 和 务实 举措 1 。 

为 保障 和 促进 中 医药 科技 事业 持续 、 健 康 发 展 ， 近 
年 来 ,《 中 医药 发 展 战略 规划 纲要 (2016 一 2030 年 )》'*、 
《中 华人 民 共 和 国 中 医药 法 》'” 、《 关 于 完善 科技 成 
果 评 价 机 制 的 指导 意见 》' 等 一 系列 政策 法 规 和 指导 
文件 明确 提出 要 加 快 构建 和 完善 新 时 期 中 医药 科技 成 果 
评价 机 制 ， 建 立 符合 中 医学 科 特 点 的 分 类 、 多 元 评价 指 
标 体 系 ， 破 解 评价 体系 不 适用 、 评 价 维度 单一 等 问题 ， 
提高 评价 标准 化 和 规范 化 水 平 ， 为 中 医药 科技 事业 发 展 
树立 正确 导向 。 

目前 , 我 国 中 医药 科技 成 果 评 价 尚 缺乏 分 类 、 适 用 、 
成 熟 的 评价 指标 体系 ， 套 用 笼统 的 科技 成 果 评 价 方法 无 
法 充分 体现 中 医药 的 特色 和 优势 ; 中 医药 科技 研究 
类 型 繁杂 ， 统 一 的 评价 体系 难以 指导 不 同类 型 科技 成 果 
的 评价 实践 " 。 此 外 ,评价 维度 较为 局 限 ， 仍 存在 “ 唯 
论文 、 唯 职称 、 唯 学 历 、 唯 奖项 ”的 “四 唯 ”问题 ， 
评价 指标 无 法 全 面 反映 成 果 综 合 价值 * 。 新 时 期 中 医 
药 科 技 成 果 评 价 的 导向 既 要 与 中 医学 科 特 色 优 势 相 适 
应 ， 也 要 能 够 全 面 反映 科技 成 果 的 科学 、 技 术 、 经 济 、 
社会 、 文 化 综合 价值 ， 成 为 调动 科技 人 员 研 究 积 极 性 ， 
引导 中 医药 科技 创新 发 展 的 关键 抓 手 "” 。 因 此 ， 本 研 
究 基 于 分 类 评价 需求 ， 选 取 评 价 需求 最 为 迫切 的 中 医药 
临床 研究 类 科技 成 果 为 突破 口 ， 采 用 系统 方法 建立 符合 
中 医药 特点 、 科 学 合理 、 综 合 全 面 的 中 医药 临床 研究 类 
科技 成 果 评 价 指标 体系 , 以 期 为 相关 评价 实践 提供 参考 。 
1 资料 与 方法 

本 研究 开始 于 2022 年 11 H, 完成 于 2023 年 5 月 。 
1.1 组 建 研究 小 组 

为 确保 研究 质量 ， 组 建 了 结构 完整 、 职 责 明 确 的 研 
究 小 组 。 (1 ) 指导 委员 会 : 由 1 名 卫生 管理 专家 、1 
名 科研 管理 专家 组 成 ， 负 责 统筹 指导 工作 开展 ;，(2) 
秘书 组 : 由 2 名 有 具 有 卫生 管理 、 科 研 管理 研究 背景 的 人 
员 组 成 ,负责 协调 组 织 具 体 工作 ， 主 持 线 下 和 线 上 的 会 
议 、 盗 询 活 动 ， 记 录 和 管理 会 议 内 容 和 参与 人 员 ， 评估 
咨询 结果 和 计算 权重 指标 ， 撰 写 相 关 报 告 ，(3 ) 文献 
研究 组 : 由 2 名 具有 循 证 医学 、 卫 生 管 理 研究 背景 的 人 
员 组 成 ， 负 责 梳 理 和 分 析 相 关 文 献 资料 ， 形 成 备 选 指标 
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池 ; (4) 专题 小 组 : 由 2 名 卫生 管理 专家 、2 名 科研 
管理 专家 和 1 名 临床 研究 专家 组 成 ， 负 责 根据 既定 专题 
展开 研讨 ， 并 六 选 评价 指标 和 设置 评价 要 点 ; (5) 共 
识 专 家 组 : 由 13 名 具有 临床 医学 、 管 理学 、 中 医学 、 
循 证 医学 、 公 共 卫 生 等 专业 人 研究 背景 的 研究 人 员 和 临床 
专家 组 成 ， 负 责 审阅 评价 指标 体系 ， 提 出 修改 意见 ， 以 
及 为 各 评价 指标 相对 重要 性 进行 打分 。 
1.2 文献 分 析 法 

在 检索 阅读 相关 政策 法 规 、 指 导 文件 、 期 刊 、 报 告 、 
书籍 的 基础 上 ， 分 析 科 技 成 果 评 价 指标 体系 研究 现状 ， 
整理 关于 中 医药 科技 成 果 评 价 的 建议 意见 ， 明 确 指 标 体 
系 构建 原则 和 要 点 。 通 过 系统 回顾 我 国医 学 领域 科技 成 
果 评 价 指标 体系 ， 收 集 、 梳 理 和 提炼 评价 指标 ， 形 成 备 
选 指标 池 。 
1.3 ”专题 小 组 讨论 

专题 小 组 讨论 又 称 焦点 小 组 访谈 ， 是 通过 组 织 同 类 
人 员 组 成 小 组 ， 针 对 特定 研究 议题 展开 提问 、 交 流 和 讨 
论 ， 从 而 综合 观点 ， 得 出 深入 结论 的 一 种 定性 人 研究 方 
法 “"" 。 本 研究 邀请 长 期 从 事 科 研 管理 、 卫 生 管理 、 
临床 研究 等 工作 的 多 领域 、 多 学 科 专 家 ， 基 于 文献 分 析 
结果 开展 专题 讨论 ， 明 确 科技 评价 工作 原则 和 要 求 ， 探 
讨 中 医药 临床 研究 类 科技 成 果 评 价 要 点 、 重 点 和 难点 ， 
针对 目前 评价 实践 中 的 具体 问题 提出 应 对 策略 ， 并 进 一 
步 六 选 评价 指标 和 设置 评价 要 点 ,初步 形 成 评价 指标 体 
系 。 
1.4 德尔 菲 法 

德尔 菲 法 是 一 种 依托 匿名 水 询 开 展 的 专家 咨询 方 
法 ， 可 通过 重复 调查 获取 群体 意见 和 达成 共识 2; 。 本 
研究 根据 初步 搭建 的 评价 指标 体系 制作 专家 函 询 表 ， 并 
采用 李 克 特 (Likert ) 5 级 评分 法 设置 指标 重要 性 评分 : 
9 分 为 很 重要 ，7 分 为 重要 ，5 分 为 一 般 ，3 分 为 不 重要 ， 
1 分 为 很 不 重要 。 邀 请 经 验 丰 富 的 科研 管理 、 卫 生 管 理 、 
临床 研究 、 中 医 、 中 西医 结合 等 领域 专家 作为 水 询 对 象 。 
在 确认 专家 不 存在 利益 冲突 后 ， 本 研究 使 用 匿名 男 询 表 
收集 专家 对 指标 和 标准 的 删 减 、 增 加 和 修改 意见 ， 对 各 
评价 指标 的 重要 性 评分 ， 以 及 对 指标 体系 的 总 体 意见 。 
15 统计 学 分 析 

在 收 到 专家 反馈 后 ， 本 研究 从 以 下 方面 分 析 本 轮 德 
尔 菲 专家 咨询 的 结果 。 

(1) 专家 积极 程度 。 通 过 计算 专家 积极 系数 ， 即 
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回收 到 的 有 效 问卷 数 与 发 放 问卷 数 的 比值 ， 反 映 专 家 人 参 
与 本 课题 的 积极 程度 "21 。 

(2) 专家 权威 程度 。 使 用 判断 依据 系数 (Ca) 和 
熟悉 程度 系数 ( Cs ) 的 算术 平均 数 , 即 专家 权威 系数 ( Cr ) 
反映 专家 权威 程度 。 其 中 ， 通 过 为 专家 在 作答 时 采用 的 
判断 依据 以 及 该 依据 产生 的 影响 赋值 可 计算 Ca, 包括 
实践 经 验 (0.5, 0.4, 0.3) 、 理 论 分 析 (0.3、0.2、0.1)、 
同行 了 解 (0.1、0.1、0.1 ) 、 直 观感 觉 (0.1、0.1、0.1) 
4 个 方面 和 大 、 中 、 小 3 种 影响 程度 ; 通过 专家 关于 熟 
悉 程度 的 自我 评价 , 包括 不 熟悉 ( 0.2 ) 、 不 大 熟 悉 ( 0.4 )、 
一 般 熟悉 (0.6) 、 熟 悉 (0.8) 、 很 熟悉 (1)5 个 层 
次 ,计算 Cso Cr 越 大 表明 专家 意见 权威 程度 越 高 ， 当 
Cr > 0.7 时 ， 可 认为 本 轮 专家 意见 具有 较 高 权威 性 1 。 

(3 ) 意见 集中 程度 。 通 过 计算 专家 对 各 评价 指标 
的 重要 性 评分 算术 平均 数 反 映 专 家 意见 的 集中 程度 2 。 

(4) 意见 协调 程度 。 通 过 计算 变异 系数 CV) 反 
映 意见 分 歧 程 度 ，Kendall's W 系数 反映 意见 协调 程度 。 
CV 越 小 ，Kendall's W 越 大 ， 表 示 专 家 对 指标 内 容 的 意 
见 分 歧 越 小 ， 协 调 程度 越 好 5。 。 

采 用 Microsoft Excel 2019 和 IBM SPSS Statistics 26 
进行 统计 分 析 ， 以 P<0.05 为 差异 有 统计 学 意义 。 

1.6 ”指标 筛选 和 体系 完善 

评价 指标 筛选 、 修 改 标准 如 下 : 纳入 重要 性 评分 均 
数 >4.5 H CV <0.5 的 指标 ， 删 除 不 满足 以 上 任 一 条 件 的 
指标 ; 对 于 超过 30% 的 专家 提出 修改 意见 的 指标 ， 则 
在 根据 专家 意见 修改 完善 后 ， 将 该 指标 纳入 下 一 轮 函 询 
问卷 里 ， 对 于 有 专家 提出 删除 意见 的 指标 ， 则 在 下 一 轮 
函 询 问卷 中 征询 所 有 专家 的 意见 “1 。 评 价 指标 W 具有 
统计 学 意义 (P<0.05 ) ， 且 CV<0.5 可 认为 专家 就 问卷 
指标 重要 性 达成 一 致 ， 超 过 75% 的 专家 同意 评价 指标 
和 标准 可 认为 专家 就 评价 指标 体系 达成 共识 。 

1.7 层次 分 析 法 (AHP ) 

AHP 是 一 种 复杂 决策 方法 ， 在 对 决策 问题 进行 深 
入 分 析 的 基础 上 ， 通 过 将 问题 分 解 为 多 个 层次 和 因素 ， 
构建 结构 模型 ， 利 用 定量 信息 和 数学 方法 实现 对 层次 和 
因素 的 重要 性 排序 "8 。AHP 在 多 个 领域 被 广泛 用 于 计 
算 指 标 权 重 ， 上 具体 步 又 包括 构建 层次 结构 ， 根 据 专家 评 
分 结果 构建 两 两 比较 的 判断 和 矩阵， 计算 指标 权重 ， 以 及 
进行 一 致 性 检验 。 通 过 计算 一 致 性 指标 (CL) 和 平均 随 
机 一 致 性 指数 CRI) 的 比值 , 可 获得 一 致 性 比例 (CR ) 。 
其 中 ，CJ= (入,.-n ) / (n-1) ， 入 表示 最 大 特征 值 ， 
为 矩阵 阶 数 。CR<0.1 表示 判断 矩阵 的 一 致 性 在 可 接受 
JEA 。 


2 结果 


2.1 评价 指标 体系 初步 形成 


ChinaXiv 合 作 期 刊 


Chinese General Practice (GP 


文献 研究 组 对 相关 文献 资料 展开 梳理 和 分 析 ， 明 确 
了 我 国 新 时 期 科技 评价 要 求 、 当 前 科技 评价 存在 的 问题 
及 评价 指标 体系 的 构建 原则 等 ， 整 理 、 提 炼 指标 要 素 ， 
形成 备 选 评价 指标 池 。 邀 请 2 名 科研 管理 专家 、2 名 卫 
生 管理 专家 、1 名 临床 研究 专家 先后 进行 3 次 专题 小 组 
讨论 ， 筛 选 评价 指标 ， 初 步 形成 评价 指标 体系 ， 包 含 门 
监 指标 10 条 、 一 级 指标 4 条 、 二 级 指标 17 条 、 评 价 要 
点 17 项。 由 秘书 组 将 该 结果 制作 德尔 非 专 家 函 询 表 。 
2.2 ”德尔 菲 专家 咨询 结果 
2.2.1 专家 积极 程度 : 两 轮 德尔 菲 咨 询 分 别 向 13 名 专 
家 发 出 函 询 表 ， 均 在 规定 作答 时 间 内 全 部 收回 ， 专 家 积 
极 系数 为 100%。 
2.2.2 ”专家 基本 情况 : 受 邀 参与 德尔 菲 专家 咨询 的 专家 
共 13 名 ， 包 括 男性 10 名 (77% ) 、 女 性 3 名 (23%) 
分 别 , 来 自 北京 、 上 海 、 广 州 、 成 都 的 高 校 和 医院 。 专 
家 平均 年 龄 (45.6+5.6 ) 岁 ， 其 中 <41 岁 2 名 (15% ) , 
41~50 # 7% (54%) , 51-60 # 4% (31%). BR 
团队 资历 丰富 ，9 名 (69%) 为 博士 研究 生 学 历 ， 其 余 
4% (31% ) 为 硕士 研究 生 学 历 ; 6 名 ( 46% ) 为 教授 ， 
6 名 (46% ) 为 研究 员 , 1 名 (8% ) 为 主任 医师 。13 
名 专家 的 平均 工作 时 间 为 21.1 年 ， 最 长 工作 时 间 为 30 
年 。 参 与 专家 的 专业 领域 (可 多 选 ) 涉及 临床 医学 (8 
名 ,62% ) 、 管 理学 (54%, 38%). PRY (6 名 ， 
46% ) 、 循 证 医学 (3 名 , 23% ) 和 公共 卫生 (1 名 , 8% ); 
人 研究 领域 ( 可 多 选 ) 集中 于 临床 医学 (9 名 ，69% ) 、 
科研 管理 (5 名 ,，38% ) 、 基 础 医学 (3 名 ，23% ) 、 
循 证 医学 (3 名 ，23% ) 和 医院 管理 (2 名 ，15% ) 。 
2.2.3 ”专家 权威 程度 : 根据 专家 对 判断 依据 和 熟悉 程度 
的 自我 评价 ， 计 算 第 一 轮 德尔 菲 咨 询 专家 群体 权威 系数 
为 0.94， 第 二 轮 为 0.93， 均 大 于 0.7， 表 明 专 家 权威 性 
wea P| 
224 意见 集中 程度 : 第 1 轮 咨询 中 各 评价 指标 的 重要 
性 评分 平均 数 如 下 : 临床 价值 维度 一 级 指标 为 9.00 分 ， 
二 级 指标 为 7.62 ~ 8.54 分 ; 学术 影 响 维度 一 级 指标 为 
7.31 分 ， 二 级 指标 为 6.08 ~ 7.62 分 ; 成 果 水 平 维度 一 
级 指标 为 7.77 分 ， 二 级 指标 为 5.62 ~ 8.69 分 ; 成 果 效 
益 维度 一 级 指标 为 7.62 分 ， 二 级 指标 为 5.31 ~ 7.31 分 。 
第 二 轮 咨询 中 ， 成 果 水 平 维度 一 级 指标 为 7.46 分 ， 二 
级 指标 为 5.62 ~ 8.69 分 ; 成 果 效 益 维度 一 级 指标 为 7.62 
分 ， 二 级 指标 为 6.23 ~ 7.77 分 。 


排版 稿 


2.2.4 意见 协调 程度 : 第 一 轮 咨 询 中 ， 一 级 指标 CV 
为 0.00 ~ 0.37, “临床 价值 ”维度 下 二 级 指标 CT 
为 0.10 ~ 0.22，“ 学 术 影 响 ” 维 度 下 二 级 指标 CT 
为 0.19 ~ 0.31，“ 成 果 水 平 ” 维 度 下 二 级 指标 CT 
为 0.08 ~ 0.37，“ 成 果 效 益 ” 维 度 下 二 级 指标 CT 
为 0.20 ~ 0.33， 总 体 指标 、 一 级 指标 和 二 级 指标 的 
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Kendall's W R #4) GN 0.40, 0.37, 0.41, x2 检验 结 
果 显 示 双 侧 检验 显著 性 尸 均 <0.05; 第 二 轮 咨询 中 ,成 
果 “ 成 果 效益 ”维度 下 二 级 指标 CV 为 0.19 ~ 0.28, 其 
余 指标 CV 范围 与 第 一 轮 结果 无 异 ， 总 体 指标 、 一 级 指 
标 和 二 级 指标 的 Kendall's W 系数 分 别 为 0.34、0.36、0.34， 
x 检验 结果 显示 双 侧 检验 显著 性 P 均 <0.05。 上 述 结 
果 表 明 专 家 意见 协调 程度 较 好 '” ， 重 要 性 评分 在 总 体 
指标 、 一 级 指标 和 二 级 指标 上 均 趋 于 一 致 。 
23 ”指标 体系 修改 与 完善 

在 第 一 轮 咨询 中 ， 所 有 指标 满足 重要 性 评分 均 数 
>4.5 H. CV<0.5。6 名 (46% ) 专家 建议 删除 “成 果 水 平 ” 
维度 下 的 “复杂 与 难 易 程度 ”指标 ， 原 因 是 复杂 与 难 易 
程度 与 成 果 水 平 并 不 存在 直接 关联 ， 相 反 ， 应 支持 研究 
者 使 用 简单 、 高 效 的 方法 取得 同样 的 成 果 ， 设 置 该 指标 
容易 产生 错误 导向 ; 74 (54% ) 专家 建议 在 “成 果 效 益 ” 
维度 下 增加 “经 济 效益 ”指标 ， 原 因 是 经 济 效益 是 衡量 
科技 成 果 毕 合 价值 的 必要 考虑 之 一 ; 9 名 (69% ) 专家 
共 对 评价 要 点 提出 了 15 项 完善 表述 的 建议 。 秘 书 组 在 
汇总 专家 意见 后 ， 对 评价 指标 体系 进行 了 修改 完善 ， 并 
形成 德尔 菲 函 询 表 开 展 第 二 轮 专家 咨询 。 在 第 二 轮 咨询 
中 ， 所 有 指标 满足 重要 性 评分 均 数 >4.5 H. CV<0.5, PF 
价 指标 和 评价 要 点 的 同意 率 均 高 于 75%， 可 认为 专家 就 
评价 指标 体系 达成 共识 。 
2.3 ”指标 体系 确定 与 权重 计算 
2.3.1 评价 指标 : 经 过 两 轮 德尔 菲 专 家 咨询 ， 最 终 确 定 
中 医药 临床 研究 类 科技 成 果 评 价 指标 体系 ,包含 门 槛 指 
标 10 条 及 评价 指标 中 一 级 指标 4 条 、 二 级 指标 17 条。 
2.3.2 ”指标 权重 : 根据 专家 对 评价 指标 的 相对 重要 性 评 
分 构建 判断 矩阵 ， 计 算 特 征 向 量 得 到 指标 权重 。 一 致 性 
检验 结果 显示 ， 一 级 指标 和 二 级 指标 Cr 均 <0.1， 表 明 
和 矩阵 一 致 性 在 可 接受 范围 内 :2 。 中 医药 临床 研究 类 科 
技 成 果 门 槛 指标 见 表 1， 各 评价 指标 对 应 权重 见 表 2。 
2.3.2 ”评价 要 点 ”在 根据 专家 意见 修改 完善 后 ， 为 各 个 
二 级 评价 指标 设置 评价 要 点 ， 从 而 为 具体 评价 活动 提供 
参考 ， 详 细 信 息 见 表 3。 


3 讨论 


3.1 构建 方法 的 科学 性 

目前 ， 指 标 体系 的 构建 尚 无 统一 、 标 准 的 方法 和 流 
程 。 本 研究 对 既往 文献 资料 进行 了 全 面 、 系 统 的 回顾 ， 
总 结 归 纳 了 医学 领域 科技 成 果 评价 指标 常用 的 构建 方 
法 ， 确 定 了 包括 文献 研究 、 专 题 小 组 讨论 、 德 尔 菲 专家 
咨询 、 层 次 分 析 法 等 在 内 的 主要 研究 方法 。 通 过 回顾 既 
往 针对 指标 体系 构建 的 建议 和 思考 ， 本 研究 针对 构建 过 
程 中 潜在 的 局 限 和 不 足 进 行 了 优化 ， 例 如 采用 正式 流程 
进行 专家 咨询 、 确 保 参 与 讨论 和 共识 的 专家 数量 充足 、 


ChinaXiv 合 作 期 刊 


http:www.chinagp.net_—E-mail:zgqkyx@chinagp.net.cn “SS 


具有 代表 性 和 权威 性 、 学 科 领 域 覆 盖 全 面 等 2 。 本 研 
究 由 指导 委员 会 全 程 指导 和 监管 ， 专 家 咨询 的 过 程 和 结 
果 均 由 秘书 组 详细 记录 ， 严 格 把 控 研 究 质量 ， 确 保 了 研 
究 结果 合理 性 和 准确 性 。 
3.2 ”评价 指标 的 可 靠 性 

本 研究 通过 系统 性 的 文献 回顾 形成 备 选 指标 池 ， 充 
分 参考 借鉴 了 既往 研究 成 果 ; 结合 专题 小 组 讨论 初步 得 
选 指标 ， 广 泛 汲取 了 相关 领域 专家 的 宝贵 经 验 和 意见 ， 
为 形成 可 靠 的 评价 指标 商定 坚实 基础 “2 。 而 后 ， 研 究 
遵循 正式 流程 开展 德尔 菲 专 家 咨询 以 确定 评价 指标 。 专 
家 人 数 充足 、 代 表 性 强 、 积 极 程度 高 、 权 威 程度 高 ， 一 


anf 


表 1 中 医药 临床 研究 类 科技 成 果 门 槛 指标 


Table 2 Threshold indexes of scientific and technological achievements in 


TCM clinical research 
一 级 指标 
1. 政策 法 规 


二 级 指标 
违反 科技 部 人 类 遗传 资源 管理 条 例 
AR CAN: 泄露 保密 成 果 ) 
台 、 港 、 澳 称谓 错误 


地 图 使 用 及 标注 错误 


HE: 门槛 指标 指 几 涉 及 上 述 任 一 情况 ， 应 取消 评价 资格 。 


mes 


表 2 中 医药 临床 研究 类 科技 成 果 评价 指标 权重 


Table 2 Weight of evaluation indexes of scientific and technological 


achievements in TCM clinical research 


-ai ACO ACC 
1. 临床 价值 57.92 临床 问题 重要 性 28.72 16.63 
有 效 性 22.45 13.01 
安全 性 13.72 7.95 
可 推广 性 17.55 10.16 
创新 性 与 先进 性 17.55 10.16 
2. 学 术 影 响 10.66 ”论文 发 表情 况 21.90 2.33 
学 术 界 认可 情况 64.29 6.85 
知识 产权 情况 13.80 1.47 
3. 成 果 水 平 ”16.92 ”理论 渊源 6.56 1.11 
方法 科学 性 22.47 3.80 
过 程 透 明 性 15.54 2.63 
结果 可 靠 性 47.03 7.96 
成 熟 程 度 8.40 1.42 
4. 成 果 效 益 1450 ”中 医药 传承 创新 39.31 5.70 
社会 效益 42.46 6.16 
文化 弘扬 9.12 1.32 
经 济 效益 9.12 1.32 
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中 医药 临床 研究 类 科技 成 果 评价 要 点 


Table 3 Evaluation points of scientific and technological achievements in TCM clinical research 


一 级 指标 二 级 指标 


评价 要 点 


临床 价值 “临床 问题 重要 性 


焦 的 重大 健康 问题 ， 包 括 但 

发 传染 病 防治 和 公共 卫生 事件 等 。 

以 下 评价 标准 性 试验 ， 
(1) 有 效 性 结局 


有 效 性 


选 题 应 立足 于 尚未 被 满足 的 临床 需求 和 /或 中 医药 优势 病 种 ， 可 重 ， 
不 限于 癌症 、 


具有 临床 重要 意义 ， 如 随访 终点 疼痛 组 
异 ; (3 ) 若 为 临床 对 照 研 究 ， 
如 VAS 疼痛 评分 的 MID X 1cm) 


安全 性 


比较 的 近期 与 远 期 安全 性 差异 。 


所 研究 的 中 药 或 技术 相 比 于 对 照 组 而 言 ， 


点 关注 研究 的 中 药 或 技术 的 新 发 、 严 习 


EASA BIZ 


BB “FUE” PR LY ACT PR 
心 脑 血管 病 、 糖 尿 病 、 感 染 性 疾病 、 老 年 痴 采 、 抗 生 素 耐 药 、 新 发 突 


对 于 劣 效 和 等 效 性 试验 仅 供 参考 ， eee 
指标 的 设置 应 基于 患者 重要 结局 、 终 点 结局 或 合适 的 替代 结 
解 到 轻微 疼痛 或 完全 缓解 〈VAS se <4 分 ) , 


(2) 主要 结局 指标 的 效应 量 
而 非 仅 具有 统计 学 差 
结果 应 达到 临床 最 小 重要 差异 值 ( MID， 


应 的 发 生 风险 ; 如 为 临床 对 照 研究 ， 全 面 考察 与 对 照 组 


可 推广 性 
创新 性 与 先进 性 ”综合 评估 研究 提 
论文 发 表情 况 


学 术 影 响 


TRY) 


综合 评估 中 药 或 技术 的 可 实施 性 、 可 接受 性 、 可 及 性 和 
高 相关 领域 现 有 证 据 体 等 级 .改变 临 


评估 研究 代表 性 论文 的 发 表 水 平 ， 如 国 
国内 权威 期 刊 〈 其 他 核心 期 刊 ) 、 


床 实践 的 能 力 , 评估 研究 实施 的 方法 或 研究 发 现 的 先进 程度 。 
内 外 专业 顶级 期 刊 (Q1、Q2 或 T1) 、 国 内 外 一 流 期 刊 (Q3、Q4 或 
或 国内 一 般 期 刊 〈 非 核心 期 刊 ) 。 


学 术 界 认可 情况 


综合 评估 研究 成 果 被 临床 指南 / 诊疗 规范 引用 ; 或 获得 国家 级 、 省 部 级 、 专 业 学 会 等 科技 奖励 ; 或 获得 国内 外 


同行 认可 ; 或 Web of Science 等 权威 数据 库 收录 为 高 被 引 论文 ; 或 第 三 方 媒体 机 构 好 评 ; 或 受 邀 参加 国内 外 领域 


内 顶级 学 术 会 议 并 做 大 会 主题 发 言 ; 或 


看 年 均 被 引 次 数 等 情况 。 


知识 产权 情况 
理论 渊源 
方法 科学 性 


成 果 水 平 评估 研究 受到 中 医 理论 的 支持 程度 。 


综合 考虑 以 下 评估 要 点 : 


评估 研究 成 果 形 成 知识 产权 的 情况 , 如 形成 专利 、 软 著 、 专 著 、 国 家 新 药 、 国 家 一 级 中 药 保 护 品种 等 ( 除 论文 外 ) 。 


(1 ) 设计 的 严谨 性 : 研究 应 围绕 研究 设计 容易 产生 偏 倚 的 环节 进行 评价 ， 如 随机 对 照 试验 中 的 随机 序列 产生 的 


方法 、 分 配 隐藏 、 盲 法 、 缺 失 数据 和 选择 性 报告 偏 倚 等 ， 队 列 研 究 中 样本 的 代表 性 、 


偏 倚 等 。 


混杂 因素 控制 和 结局 测量 


(2) 方法 的 可 靠 性 : 研究 参 
案 或 国内 外 公认 的 诊断 标准 。 
(3) 质量 控制 措施 : 研究 全 过 程 应 


过 程 透明 性 综合 考虑 以 下 评估 要 点 : 
(1 ) 资料 完整 性 : 
材料 等 ; 


参 使 用 的 方法 和 标准 来 源 应 
采取 有 效 的 质量 控制 措施 。 


提交 的 资料 应 能 满足 成 果 评价 的 要 求 ， 包 括 研 究 方案 、 注 册 信 息 、 


如 疾病 的 诊断 标准 来 源 于 国家 诊疗 方 


& 


具有 一 定 权威 性 ， 


研究 完整 报告 和 相关 支 


pE 


(2) 报告 规范 性 : 研究 报 
CONSORT-CHM 报告 标准 。 


综合 考虑 以 下 评 佑 要点: 
C1) 结果 稳健 性 研究 应 
(2) 结果 清晰 性 : 研究 结 
(3) 结论 准确 性 : 研究 结 


结果 可 靠 性 


际 应 用 等 情况 。 


告 应 参照 相应 研究 设计 的 国际 报告 规范 进行 


/纳入 充足 的 样本 量 , 并 采取 必要 合理 的 统计 学 方法 ( 如 意向 性 分 析 ) 验 证 结 


能 准确 反映 结论 ， 对 结果 的 解读 不 夸大 、 不 片面 、 
(4) 过 程 可 重复 性 : 


成 熟 程度 评估 所 研究 中 药 或 技术 的 成 熟 程度 ， 如 用 


得 国家 监管 部 门 


TH 


五 


报告 ， 如 中 药 复方 临床 研究 参照 


果 的 稳健 性 


ee 便于 读者 阅读 和 查询 ; 
不 隐瞒 、 不 失真 ; 


] 的 批准 和 市 场 准 入 等 ， 以 及 投入 大 规模 生产 或 临床 实 


成 果 效 益 中 医药 传承 创新 “评估 研究 在 中 医药 传承 创新 发 展 、 


现代 科学 研究 方法 阐释 中 医药 原理 方面 的 体现 程度 。 


社会 效益 评 佑 研究 的 社会 贡献 ， TEET 人 才 培 养 等 的 贡献 程度 。 


文化 弘扬 评估 研究 的 文化 贡献 程度 。 如 体现 社 


经 济 效益 评估 研究 对 中 医药 产业 ( 
注 : VAS= 视觉 模拟 评分 法 。 


定 程度 上 反映 了 咨询 结果 较为 可 靠 ; 专家 意见 协调 程度 
强 ， 反 映 专 家 价值 判断 一 致 ， 结 果 可 信 度 高 。 研 究 使 用 
层次 分 析 法 计算 指标 权重 ， 一 致 性 检验 结果 良好 ， 表 示 
专家 评分 逻辑 一 致 性 强 ， 反 映 赋 权 结果 相对 准确 。 
3.3 评价 体系 的 易 操 作 性 

最 终 确 定 的 评价 指标 体系 包含 评价 指标 、 指 标 权重 
和 评价 要 点 。 评 价 指标 简明 ， 条 目 数 量 和 各 条 目 字数 控 
制 在 合理 范围 内 , 有 利于 优化 实际 操作 、 提 高 评价 效率 ; 
评价 指标 权重 清晰 明确 ， 有 利于 直观 理解 指标 重要 性 和 


会 主义 核心 价值 观 、 科 学 家 精神 等 优秀 文化 , 或 增强 人 民 对 中 医 文化 的 认同 ， 
提升 人 民 使 用 中 医药 护卫 健康 的 信心 等 。 


含 服 务 ) 的 促进 作用 及 具体 


经济 效益 度量 值 。 


汇总 评价 结果 ; 各 指标 配 有 评价 要 点 以 供 参 考 ， 有 利于 
增强 评价 者 对 评价 指标 的 理解 ， 一 定 程度 上 能 够 避免 评 
价 过 程 主观 随意 ”| 。 
3.4 评价 体系 的 导向 性 
本 研究 基于 分 类 、 全 面 评 价 的 思路 围绕 中 医药 临床 
研究 类 科技 成 果 开 展 ， 针 对 新 时 期 科技 评价 要 求 确定 评 
价 导 向 ， 针 对 重要 评价 需求 构建 专门 评价 体系 。 评 价 指 
标 维度 全 面 ， 支 持 综合 评价 科技 成 果 的 科学 、 技 术 、 经 
济 、 社 会 、 文 化 价值 ， 重 点 突出 科技 成 果 对 临床 重大 需 
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求 和 医疗 卫生 实践 的 贡献 和 价值 ， 重 视 评 估 科 技 成 果 问 
实践 转化 的 潜力 性: ， 同 时 充分 考虑 中 医药 特色 特点 ， 
并 激励 研究 者 不 断 优化 研究 方法 ， 精 进 研究 水 平 ， 促 进 
中 医药 科学 技术 创新 发 展 。 
35 注意 事项 

在 该 评价 指标 体系 的 实际 应 用 中 , 应 注意 以 下 方面 : 
C1) 该 评价 指标 体系 基于 分 类 评价 的 原则 设计 ， 评 价 
对 象 为 符合 评价 主体 相关 要 求 、 取 得 评价 资格 的 中 医药 
临床 研究 类 科技 成 果 ， 评 价目 的 是 衡量 目标 科技 成 果 的 
综合 价值 ， 应 与 具体 中 医药 干预 措施 的 价值 评估 等 用 途 
区 别 开 。 (2) 该 评价 指标 体系 基于 定量 思路 构建 ， 目 
的 是 提供 能 够 反映 中 医药 临床 研究 类 科技 成 果 综合 价值 
的 量化 结果 ， 以 期 满足 评价 主体 的 定量 评价 需求 。 考 虑 
到 中 医药 的 特殊 性 和 复杂 性 ， 当 前 评价 指标 体系 仍 可 能 
不 够 全 面 ， 对 具体 科技 成 果 综 合 价 值 的 挖掘 能 力 仍 可 能 
不 够 突出 ， 评 价 主体 可 根据 实际 情况 考虑 额外 添加 定性 
评价 模块 ， 从 而 确保 评价 结果 人 合理、 可靠。 (3 ) 虽然 
该 评价 指标 体系 围绕 科技 成 果 “ 五 元 价值 ”的 综合 评价 
建设 ， 但 其 中 部 分 评价 指标 和 评价 要 点 仍 较为 敌 统 ， 科 
技 成 果 的 经 济 、 社 会 、 文 化 价值 缺乏 明确 、 人 合理、 成 熟 
的 评估 方法 和 标准 ， 评 价 结 果 受 到 评价 者 价值 观 的 影响 
程度 较 大 。 评 价 主体 可 针对 具体 评价 需求 ， 通 过 定性 案 
例 研 究 、 组 织 专家 讨论 和 共识 等 方式 ， 毕 合 衡量 科技 成 
果 多 元 价值 。 此 外 ， 网 络 计量 学 、 替 代 计 量 学 的 发 展 为 
科学 .合理 地 捕捉 、 测 量 社会 影响 力 提 供 了 潜在 方法 "二 1， 
但 其 应 用 仍 存在 挑战 。 
36 ”小 结 与 展望 

本 人 研究 采用 成 熟 方法 和 正式 流程 ， 围 绕 中 医药 临床 
研究 类 科技 成 果 开 展 评 价 指标 体系 构建 ， 为 相关 评价 活 
动 提供 了 参考 。 未 来 研究 应 坚持 分 类 、 全 面 的 评价 原则 ， 
为 不 同 领域 、 不 同学 科 、 不 同 科 技 活动 构建 专门 的 科技 
成 果 评 价 体 系 ， 发 挥 好 科技 评价 的 “指挥 棒 ” 作 用 ， 调 
动 科技 人 员 积 极 性 ， 促 进 研究 资源 合理 分 配 ， 引 导 科 技 
事业 健康 、 持 续 发 展 。 
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